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摘 要 : 为 研究 沙 地 信息 提取 的 方法 ,采用 基于 CART 决策 树 的 面向 对 象 方法 ,提取 中 卫 市 沙 坡 头 


特征 指数 。 
关键 词 : 


沙漠 化 是 备 受 国际 关注 的 重大 环境 问题 之 一 ， 
它 直 接 影响 人 类 的 生存 环境 和 社会 的 稳定 。 宁 夏 是 
我 国 风 沙 危 害 严 重 的 省 区 之 一 ,其 东 、 西 .北三 面 分 
别 被 毛乌素 、 腾 格 里 . 乌 兰 布 和 3 大 沙漠 、 沙 地 包围 ， 
范围 涉及 13 个 县 (市 .区 ) .90 个 乡镇 及 国有 农林 
场 ' 1 。 准 确 快捷 地 获取 沙漠 化 信息 ,是 正确 制定 沙 
漠 化 防治 政策 的 重要 依据 ,也 是 沙漠 化 研究 的 关键 
问题 之 一 。 近 些 年 遥感 监测 凭借 其 自动 化 程度 高 、 
解 译 范 围 广 .周期 性 短 等 优势 ,广泛 的 被 应 用 于 各 种 
地 物 的 提取 ,其 中 被 用 于 沙 地 信息 提取 的 遥感 解 译 
方法 也 在 不 断 的 推陈出新 。 李 元 科 '” 通 过 目 视 解 
译 研究 预 估 了 盐池 县 沙漠 化 动态 ; 李 晓 琴 ”利用 光 
谱 混 合 分 析 技 术 ,探讨 了 光谱 角 分 类 法 (SAM ) 自动 
提取 沙化 土地 和 盐 渍 化 土地 信息 ; 乔 平 林 中 用 BP 
神经 网 络 模 型 提取 了 内 蒙 内 克 什 克 腾 旗 西北 部 的 沙 
地 信息 。 在 基于 象 元 出 现 “ 椒 盐 现 象 " 后 ,人 研究 人 员 
进而 开辟 了 面向 对 象 的 领域 5 。 

CART 决策 树 是 在 1984 年 由 Breman 提出 的 一 
种 二 叉 树 分 类 方法 , 它 能 够 充分 利用 空间 辅助 信息 ， 
对 影像 的 多 个 特征 变量 进行 选择 性 组 合 ,识别 繁多 
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区 的 沙 地 信息 。 首 先 对 研究 区 进行 多 尺度 分 割 和 光谱 差异 分 割 得 到 对 象 层 ,然后 选择 合适 的 提取 
特征 和 训练 样本 点 ,最 后 输入 选择 的 提取 特征 和 样本 点 生成 CART 规则 树 ,并 对 地 物 进行 分 类 , 提 
取出 沙 地 信息 。 结 果 表 明 : 采 用 面向 对 象 的 CART 决策 树 方法 提取 沙 地 信息 具有 较 高 自动 化 程度 
和 精确 度 , 依 此 构建 的 CART 决策 树 总 体 分 类 精度 可 达到 77% ,是 最 近邻 分 类 结果 的 1.12 倍 , 支 持 
向 量 机 分 类 结果 的 1.57 倍 ,此 外 ,NDBI( 归 一 化 裸露 指数 )、GSI( 粒度 指数 ) 和 SWIR 2( 第 七 波段 ) 
均值 可 以 成 功 的 将 沙 地 、 戈 璧 和 裸 岩 石 砾 地 三 个 易 混 地 物 区 分 开 来 ,是 沙 地 提取 过 程 中 三 个 重要 的 


面向 对 象 ; 多 尺度 ; 光谱 差异 ; CART 决策 树 ; 沙 地 提取 


而 有 效 的 信息 ,从 而 实现 对 未 知 数据 的 分 类 、 预 测 和 
挖掘 。 近 些 年 来 ,很 多 国内 外 专家 学 者 做 了 CART 
决策 树 分 类 应 用 方面 的 研究 ,通过 与 传统 分 类 方法 
的 对 比 ,得 到 了 CART 决策 树 分 类 方法 分 类 精度 高 ， 
速度 快 等 结论 。 孙 建 伟 ' 利用 CART 决策 树 方法 对 
湖北 研 州 市 八 岭 山 镇 进行 了 地 物 分 类 ,取得 了 良好 
HGE, BEBE ASS) 、 康 文平 中 用 CART 决策 树 分 别 
对 西藏 部 分 区 域 和 内 蒙古 部 分 区 域 做 了 沙漠 信息 提 
RIEKER. SAAL 以 民 勤 县 为 例 ,利用 
CART 决策 树 结合 多 个 特征 提取 了 沙 地 信息 。 这 些 
沙 地 信息 提取 研究 或 是 直接 对 像素 层 直接 处 理 ,或 
是 提取 特征 较 少 , 或 是 提取 过 程 复杂 自动 化 程度 低 。 
本 文 以 宁夏 中 卫 市 沙 坡 头 区 为 研究 区 ,利用 Land- 
sat8 数据 源 ,结合 面向 对 象 的 分 类 方法 ,输入 多 个 提 
取 特 征 , 研 究 一 种 基于 CART 决策 树 高 自动 化 提取 
沙 地 信息 的 方法 。 


1 研究 区 概况 与 数据 源 


1.1 研究 区 概况 
中 卫 市 沙 坡 头 区 位 于 宁夏 回族 自治 区 中 西部 ， 
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东 邻 中 宁县 , 南 与 同心 县 海原 县 及 甘肃 省 靖 远 县 交 
汇 , 西 接 甘肃 省 景泰 县 , 北 邻 内 蒙古 自治 区 阿拉 善 左 
旗 。 境 域 东 西 长 115.3 km ,南北 宽 81.4 km ,总 面积 
5 922. 4 km ”。 地 跨 104"17' ~ 106°10'E 36°06’ ~ 
37"50'N。 境 内 东 接 腾 格 里 沙漠 南 侧 边缘 ,中 部 有 黄 
河 截 腰 穿 过 ,南边 以 山 台 、 山 地 为 主 ,整体 地 势 呈 西 
南 高 .东北 低 的 势 态 。 沙 坡 头 区 属于 半 干 旱 气候 ,是 
典型 的 大 陆 性 季风 气候 和 沙 浇 气候 ,春暖 壕 、 秋 凉 
早 、 夏 热 短 、 冬 寒 长 , 风 大 沙 多 ,干旱 少雨 ,而 又 得 黄 
河 灌溉 之 优势 ,成 为 了 西北 地 区 重要 的 商品 粮 ,水产 
品 和 设施 蔬菜 生产 基地 。 所 以 ,中 卫 人 民 自 古 以 来 
凭借 自己 的 智慧 和 努力 与 沙漠 化 作 斗 争 ,研究 沙 坡 
头 区 的 沙 地 信息 对 于 治 沙 防 沙 具 有 重大 意义 。 
1.2 数据 源 

Landsat-8 卫星 是 2013 年 2 月 11 号 由 NASA 发 
射 的 陆地 卫星 , Landsat-8 上 携带 有 两 个 主要 和 载 答 : 
OLI( Operational Land Imager, 陆地 成 像 仪 ) 和 TIRS 
(Thermal Infrared Sensor , 热 红 外 传感器 ) 。OLI 陆地 
成 像 仪 包括 9 个 波段 ,空间 分 辩 率 为 30 m, 其 中 包 
括 一 个 15 m 的 全 色 波 段 ,TIRS 包括 2 个 波段 。 
Landsat 8 陆地 卫星 凭借 其 客观 ,大 尺度 .多 时 相 、 低 
成 本 方便 快捷 及 非 破 坏 性 等 特点 ,极其 适合 在 土地 
沙漠 化 监测 中 应 用 。 本 文选 取 的 数据 是 2016 年 8 
月 9 日 美国 陆地 卫星 Landsat-8 所 获取 的 遥感 数据 
影像 ,名 称 代 码 为 LC81300342016222LGN00。 在 信 
息 提取 前 ,以 ENVI 作为 图 像 预 处 理 软件 ,对 获取 的 
影像 按 序 进行 辐射 定 标 .FLAASH 大 气 校正 .影像 融 
合 及 裁剪 。 最 终 得 到 空间 分 辨 率 为 15 m 的 宁夏 中 
卫 市 沙 坡 头 区 多 光谱 数据 影像 (图 1) 。 


3 Miles 


1 宁夏 中 卫 市 沙 坡 头 区 预 处 理 数据 


Fig. 1 Preprocessing data of Shapotou District in 


Zhongwei , Ningxia 


2 实验 研究 流程 及 分 类 原理 


基于 CART 决策 树 算法 的 面向 对 象 提 取 方 法 主 
要 包括 :影像 分 割 、 对 象 特征 提取 、CART 决策 树 分 
类 规则 的 建立 、 利 用 生成 的 决策 树 进行 分 类 。 工 作 
采用 ENVI 和 Ecognition 软件 进行 。 其 整体 技术 流 
程 如 图 2 所 示 。 
2.1 影像 分 割 原理 
2.1.1 FRADA 多 尺度 分 割 是 面向 对 象 的 提 
取 方 法 中 较为 常用 的 一 种 分 割 算法 , 它 是 一 种 自 下 
而 上 (bottom-up ) 的 方法 ,通过 合并 相 邻 的 像素 或 小 
的 分 割 对 象 ,在 保证 对 象 与 对 象 之 间 平 均 异 质 性 最 
小 对象 内 部 像 元 之 间 同 质 性 最 大 的 前 提 下 ,基于 区 
域 合并 技术 实现 影像 分 制 。 异 质 性 的 具体 计算 方式 
如 下 : 


调整 分 割 尺度 

波段 权 值 
紧密 度 

形状 指数 
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图 2 ”总体 技术 流程 图 


Fig.2 General technical flow chart 
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式 中 :f 是 异 质 性 ;wj 是 光谱 信息 权重 ;ww 是 形状 
信息 权重 ;这 两 个 权重 的 和 为 1 ;h 是 光谱 异 质 性 
的 值 ;hs 是 形状 异 质 性 的 值 ;wy 和 wo 分别 
是 紧密 度 和 光滑 度 的 权重 ,它们 的 和 为 15 compact 和 
hoon 分 别 是 紧密 度 和 光滑 度 的 异 质 性 值 "| 。 

2.1.2 光谱 差异 分 剖 ”光谱 差异 分 割 不 能 基于 像 
素 层 来 创建 新 的 分 割 层 , 它 仅仅 是 一 种 分 割 优化 手 
段 , 它 需要 在 多 尺度 分 割 算法 得 到 的 分 割 结果 基础 
上 ,通过 分 析 相 邻 分 割 对 象 的 亮度 差异 是 否 满足 给 
定 的 国 值 ,来 决定 是 否 将 对 象 进行 合并 。 相 邻 影 像 
对 象 之 间 的 光谱 差异 (g) 的 计算 公式 为 : 


i 
wn * 163, -63,| (3) 


式 中 :6b1、b52、03 分 别 表示 影像 的 3 个 波段 ;wn 、 
Why wng TAE = E Aa 的 权重 。 归 一 
化 计算 如 下 : 


WN yy =wy/ (wy, + Wi + Wis ) (4) 
WN yy =wy/ (Wy, + Wy + wy ) (5) 
WN yg = Ww/ (Wy, + Wi + wy; ) (6) 


利用 光谱 差异 分 割 ,一 方面 能 够 减少 分 割 对 象 
的 数量 , 另 一 方面 也 能 在 一 定 程 度 上 改善 “过 分 割 ” 
的 现象 ” 。 
2.2 CART 决策 树 分 类 原理 

分 割 只 是 将 像素 层 划 分 为 一 个 一 个 的 对 象 ,如 
果 将 其 赋予 类 别 信息 ,还 需要 分 类 这 一 关键 环节 。 
本 文采 用 CART 决策 树 方法 对 影像 对 象 进行 分 类 。 
CART( Classification And Regression Tree ,分 类 回归 
树 ) 算 法 采用 了 一 种 二 分 递归 分 割 的 技术 ,通过 计 
算 Gini 系数 选取 属性 集中 的 某 个 属性 ,将 当前 待 分 
类 的 样本 集 分 为 两 个 子 样本 集 , 并 循环 此 步骤 ,直到 
当前 待 分 类 的 样本 集 被 判定 为 叶 节 点 或 达到 停止 分 


类 的 条 件 。 
基尼 系数 的 定义 为 : 
aD 
Gini_Index =1 - py P (j/h) (7) 
n(h 2 
PU) =, Ph) =1 (8) 
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本 , 当 某 一 测试 变量 值 为 h 时 属于 第 /类 的 概率 ; 


n;( 有 hh) 为 训练 样本 中 测试 变量 值 为 hh 时 属于 第 了 类 
的 样本 个 数 ;n(h) 为 训练 样本 中 该 测试 变量 值 为 h 
的 样本 个 数 ;J 为 类 别 个 数 "1。 

由 于 每 次 分 割 都 只 将 样本 集 划 分 为 两 个 子 集 ， 
因此 最 终生 成 的 决策 树 是 一 个 二 叉 树 ,结构 简洁 明 
了 ,使 用 的 分 割 规则 清晰 易 懂 ,整个 过 程 也 比较 符合 
人 们 一 般 的 思维 习惯 。 

2.2.1 训练 样本 选择 CART 决策 树 分 类 是 一 种 
典型 的 监督 分 类 算法 ,训练 样本 选择 的 好 坏 直接 影 
响 分 类 的 优 劣 ,所 以 样本 的 选择 不 仅 要 具有 代表 性 
和 上 典型 性 ,而 且 还 要 具有 区 域 样 点 的 完备 性 '"|。 通 
过 对 研究 区 域 的 地 表 覆 盖 状 况 进行 解 译 ,将 研究 区 
分 为 沙 地 植被 水域、 建设 用 地 戈壁 和 裸 岩石 砾 地 
6 类 土地 类 型 ,在 此 分 类 体系 下 ,本 文 利用 Google 地 
图 ,用 人 机 交互 的 方法 选择 1 552 样本 点 作为 训练 
对 象 ,其 中 , 沙 地 .植被 水域 .建设 用 地 、 戈 壁 和 裸 岩 
石 砾 地 的 样本 数 分 别 为 :158 .248 、42 .321 .345 .438 
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地 ;植被 以 草地 、 林 地 ,绿色 耕地 为 主 ;水 域 是 湖泊 、 
黄河 ,水库 等 ;建设 用 地 有 城镇 .道路 和 其 他 设施 用 
地 ; 裸 岩 石 砾 地 为 山 丘 山脉 。 所 选 样本 均匀 分 布 在 
研究 区 内 ,并 且 代 表 每 一 类 别 的 特点 区 域 。 此 外 ,这 
些 样本 点 也 将 会 作为 对 比 算法 (最 近邻 法 和 支持 向 
量 机 法 ) 的 样本 ,从 而 达到 使 精度 评价 具有 客观 性 
的 目的 。 
2.2.2 特征 指标 目前 尚 没有 能 够 直接 准确 提取 
沙 地 信息 指数 的 方法 ,一 般 运 用 分 类 方法 提取 。 
CART 决策 树 使 用 贪心 算法 ,从 大 量 属性 中 选择 最 
优 组 合 构成 分 类 模型 ,数据 特征 变量 的 增加 可 能 会 
导致 决策 规则 的 改变 ,但 最 终 得 到 的 分 类 方法 一 定 
是 最 优 。 因 此 ,在 遥感 影像 的 分 类 中 , 尽 可 能 提供 有 
效 特征 量 对 增加 决策 树 精 度 具 有 很 大 的 帮助 。 总 结 
相关 研究 ,本文 从 光谱 特征 .形状 特征 纹理 特征 、 自 
定义 特征 这 儿 个 方面 选取 ,总 共 22 个 特征 。 

光谱 特征 : 原 影像 的 7 个 波段 均值 。 

形状 特征 :选取 了 紧 致 度 (compaciness) 和 形状 
指数 (shape index), 

纹理 特征 :采用 了 灰 度 共生 和 矩阵 (GLCM) 的 几 
个 指标 , 包括 均值 (Mean)、 炉 (Entropy ) 、 同 质 性 
( Homogeneity ) 、 相 异性 (Dissimilarity ) 、 方 差 (Std- 
Dev) 对比度 (Contrast)\ 相关 性 ( Correlation ) 。 


tó wy 


自 定义 特征 :用 于 提取 植被 的 归 一 化 植被 指数 
( NDVI) 和 土壤 调节 植被 指数 (S4V1)' ;常用 于 提 
取水 体 的 修改 型 归 一 化 水 体 指数 (MNDWI) ;用 
于 反映 地 表 的 裸露 状况 的 归 一 化 裸露 指数 (NDB7) 
和 粒度 指数 (GS1) "” ;用 于 提取 城镇 的 比值 居民 
地 指数 (RRI)"™]。 


3 分 类 实现 及 结果 分 析 


3.1 多 尺度 分 割 及 光谱 差异 分 割 

本 试验 采用 试 错 法 选取 最 优 分 割 尺 度 参数 , 即 
通过 不 断 变 换 分 割 的 尺度 以 及 调整 形状 和 紧密 度 的 
权重 ,得 到 不 同 的 分 割 结果 ,最 后 根据 先 验 知识 和 人 
的 判别 能 力 选取 最 优 分 割 尺度 参数 1。 以 5 为 步 
长 ,从 尺度 5 取 到 尺度 100, 经 过 多 次 试验 发 现 , 在 
形状 信息 权重 为 0.2, 紧 密度 为 0.5 的 情况 下 ,尺度 
为 70 时 会 出 现 戈壁 与 其 周边 沙 地 混 为 一 个 对 象 的 
现象 ,尺度 为 30 时 地 物 分 割 过 于 破碎 ,50 的 尺度 
下 ,同一 个 对 象 满足 异 质 性 比较 小 的 条 件 ,而 又 有 些 
过 分 割 , 为 下 一 步 光 谱 差 异 分 制 做 好 准备 ,如 图 3 所 
示 。 

影像 分 割 中 各 个 波段 的 权重 选择 对 分 割 结果 也 
会 产生 很 大 影响 ,由 于 本 文选 用 分 类 的 方法 提取 沙 
地 信息 ,所 以 对 每 个 波段 都 有 同样 的 诉求 ,因此 设置 
七 个 波段 的 比值 为 1 :1 :1:1:1:1:1”。 然 后 
对 尺度 为 50 的 结果 进行 光谱 差异 分 割 ,同样 采用 试 
错 法 ,尽量 选择 可 以 将 若干 个 相同 地 物 类 型 的 对 象 
合并 为 一 个 ,或 少数 对 象 , 错 分 概率 小 的 尺度 ,如 图 
4。 最 终 选择 尺度 为 100 的 优化 分 割 结果 作为 后 续 
分 类 的 目标 图 像 。 
3.2 影像 分 类 

把 在 ENVI 里 选 好 的 样本 导入 到 Ecognition Æ, 
Ecognition 提供 自动 化 程度 很 高 的 决策 树 分 类 器 , 选 
择 上 文选 取 的 22 个 特征 指数 ,做 CART 决策 树 分 
类 ,并 生成 分 类 规则 。 分 类 规则 如 图 5 ,决策 树 左 枝 
kt, AAR 

观察 生成 的 规则 树 得 出 :(1) 通过 NAR( 第 五 波 
Pt) AI SWIR 1 第 六 波段 ) 均 值 可 区 分 出 水 域 和 裸 岩 
石 砾 地 ; (2) NDBI,RRI, NIR (第 五 波段 ) 均值 和 
RED( 第 四 波段 ) 均值 的 组 合 提取 出 植被 和 建设 用 
地 ;(3) 由 GSI 和 SWIR 2( 第 七 波段 ) 均 值 分 类 出 沙 
地 和 戈壁 ,由 RRI 的 另 一 阔 值 .Coastal( 第 一 波段 ) 
均值 SWIR 2( 第 七 波段 ) 均 值 ,WDBI、GSI 分 离 出 裸 


岩石 砾 地 建设 用 地 、 蕊 壁 。 其 中 ,容易 混 消 的 三 类 
地 物 : 沙 地 、 戈 壁 和 裸 岩石 砾 地 ,主要 由 NDBI GSI 
和 SWIR 2( 第 七 波段 ) 均 值 三 个 特征 所 区 分 。 基 于 
以 上 规则 树 ,生成 分 类 结果 ,如 图 6a 所 示 。 

为 比较 CART 决策 树 的 分 类 精度 ,并 确保 评价 
的 客观 性 和 精确 性 ,本 文 基 于 相同 的 分 割 图 层 和 相 
同 的 样本 ,选用 同样 的 特征 ,分 别 采用 最 近邻 法 和 支 
持 向 量 机 法 两 种 经 典 的 监督 分 类 方法 ,对 研究 区 做 
沙 地 提取 。 其 中 最 近邻 分 类 方法 中 进行 特征 空间 最 
优化 (Feature space optimization ) , ffi H 5 个 特征 
(Compactness , Shape index, Mean Layer5 , Mean Lay- 
erl .NDVI) 并 应 用 于 所 有 类 别 , 其 分 类 结果 如 图 6b 
所 示 。 支 持 向 量 机 分 类 方法 采用 与 CART 决策 树 同 
样 的 特征 ,分 类 结果 如 图 6c 所 示 。 
3.3 ”精度 评价 

观察 图 6,CART 决策 树 和 最 近邻 分 类 效果 较为 
满意 ,而 支持 向 量 机 的 分 类 结果 中 ,除了 沙 地 和 水 域 
提取 效果 不 错 外 ,其 他 都 不 是 很 好 ,尤其 黄河 以 南 建 
设 用 地 和 戈壁 还 有 裸 岩 石 砾 地 混 消 比较 严重 。 从 定 
量 方面 研究 分 析 ,结合 目 视 解 译 随 机 选择 554 个 检 
验 点 ,为 保证 精度 评价 的 准确 性 ,检验 点 的 选择 应 尽 
量 选 择 纯净 像 元 。 本 文采 用 混淆 矩阵 对 3 种 分 类 结 
果 分 别 进 行 精度 评价 ,汇总 3 种 分 类 结果 的 精度 评 
价 , 如 表 1 所 示 , 利 用 CART 决策 树 分 类 104 个 沙 地 
检验 点 无 1 个 出 错 , 其 生产 者 精度 达到 了 100% ,用 
户 精度 达到 了 98% , 总体 分 类 精度 为 77% ,Kappa 
系数 为 0.72。 而 利用 最 近邻 分 类 104 个 沙 地 检验 
点 有 35 个 错 分 ,其 生产 精度 为 66% ,用 户 精 度 为 
98% ,总 体 分 类 精度 为 69% , Kappa 系数 为 0. 63 。 
对 于 支持 向 量 机 分 类 方法 ,104 个 沙 地 检验 点 也 无 
一 出 错 ,用 户 精 度 为 86% ,其 总 体 分 类 精度 为 49% , 
Kappa 系数 为 0.38。 由 此 可 见 ,CART 决策 树 分 类 
方法 是 一 种 高 效 高 精度 的 沙 地 提取 方法 。 


4 结论 


本 文通 过 对 CART 决策 树 研 究 和 讨论 ,采用 面 
向 对 象 方法 ,成 功 构建 了 CART 决策 树 模型 ,并 将 其 
应 用 于 中 卫 市 沙 坡 头 区 的 沙 地 提取 。 在 此 得 出 以 下 
结论 : 

(1) 对 比 最 近邻 分 类 和 支持 向 量 机 分 类 ,CART 
决策 树 表现 出 了 非常 好 的 分 类 精度 ,总体 分 类 精度 
分 别 是 最 近邻 和 支持 向 量 机 的 1. 12 倍 、1. 57 倍 ， 
Kappa 系数 分 别 是 它们 的 1.14 倍 、1. 89 倍 。 尤 其 在 
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图 3 多 尺度 分 逢 


I 试 错 


(d) 尺度 为 70 


图 


Fig.3 Multi-scale segmentation trial and error chart 


(qd) REA 120 


图 4 ”光谱 差异 分 割 试 错 图 


Fig.4 Spectral difference segmentation trial and error chart 
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5 CART 规则 树 
Fig.5 CART rule tree 


图 6 CART 决策 树 分 类 结果 (a) ,最 近邻 分 类 结果 (b) 和 支持 向 量 机 分 类 结果 (ec) 


Fig.6 CART decision tree classification results (a), nearest neighbor classification results (b) and support vector machine 


classification results (c) 


Rl 三 种 算法 的 混淆 矩阵 精度 评价 


Tab.1 Accuracy evaluation of confusion matrix of three algorithms 


类 别 沙 地 生产 者 精度 沙 地 用 户 精 度 总 体 分 类 精度 Kappa 系数 
CART 决策 树 算法 1.00 0.98 0.77 0.72 
最 近邻 算法 0.66 0. 98 0.69 0.63 
支持 向 量 机 算法 1.00 0. 86 0.49 0.38 


沙 地 的 提取 方面 值得 借鉴 推广 , 沙 地 的 生产 者 精度 。 后 得 出 NDBI、GSI 和 SWIR2( 第 七 波段 ) 均 值 是 反映 
分 别 是 它们 的 1.52 倍 \1 倍 ,用 户 精 度 分 别 是 它们 ” 沙 地 信息 的 重要 特征 量 。 所 筛选 出 来 的 特征 为 以 后 


的 1 倍 .1.14 售 。 的 沙 地 信息 提取 研究 中 可 提供 一 定 的 参考 价值 。 
(2) CART 决策 树 采 用 贪心 算法 ,虽然 输入 更 (3) CART 决策 树 是 一 种 监督 分 类 方法 ,样本 


多 的 提取 特征 对 最 优 决策 树 的 构建 不 产生 过 多 影 ” 的 质量 对 分 类 精度 至 关 重 要 。 由 于 研究 条 件 限制 ， 
响 , 但 减少 不 必要 的 特征 输入 可 以 提高 提取 效率 和 若 训 练 样本 和 验证 样本 均 为 实地 采集 将 有 助 于 提高 
自动 化 程度 。 本 试验 中 共 输 入 了 22 个 提取 特征 ,最 。 试验 的 准确 性 和 分 类 结果 的 精确 性 。 
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Sand information extraction method based on CART decision tree 


ZHANG Xi-wei', WANG Lei’, WANG Xi-yuan'” 
(1 School of Physics and Electronic-Electrical Engineering , Ningxia University , Yinchuan 750021 , Ningxia , China ; 
2 Breeding Base for State Key Laboratory of Land Degradation and Ecological Restoration in Northwest China , 
Yinchuan 750021, Ningxia,China; 3 Ningxia Hui Autonomous Region Desert Information Intellisense Key Laboratory , 


Ningxia University , Yinchuan 750021 , Ningxia , China) 


Abstract; This paper used the object-oriented method and CART decision tree method to extract the sand infor- 
mation with high degree of automation and comprehensive extraction features. The main research process is as fol- 
lows: (1) Select the study area and preprocess the image of the study area. (2) Use multi-scale segmentation and 
spectral difference segmentation to obtain the object layer. (3) Select rich extraction features and training sample 
objects. (4) Training features and sample objects to get the CART rule tree. (5) Apply all objects to the rule tree 
to get the classification result. (6) Compare the Nearest neighbor and Support vector machine classification results. 
Finally , Compared with the current research on extracting sand information by CART decision tree. The overall clas- 
sification accuracy reached 77% ,which is 1. 12 times of the Nearest neighbor classification result ,1.57 times of the 
support vector machine classification result. In addition , normalized diffevence bare index ( NDBI), granularity size 
index ( GSI) and the seventh band (SWIR 2) can successfully distinguish three easily mixed objects of sand, Gobi 
and bare rock , which are three important characteristic indexes in the process of sand extraction. The experiment has 
proven this method is a feasible sand extraction method for actual desertification monitoring. 


Key words: object-oriented; multi-scale; spectral differences; CART decision tree; sand extraction 


